
R做數(shù)據(jù)分析及挖掘培訓(xùn)
第一章:統(tǒng)計基礎(chǔ)
第一節(jié):描述性統(tǒng)計
1、集中趨勢
2、離散測度
第二節(jié):統(tǒng)計量及其抽樣分布
1、統(tǒng)計量
2、分布
3、樣本均值的分布與中心極限定理
4、樣本比例的抽樣分布
5、兩個樣本均值之差的抽樣分布
6、關(guān)于樣本方差的分布
第三節(jié):參數(shù)估計
1、參數(shù)估計
2、一個總體參數(shù)的區(qū)間估計
3、兩個總體參數(shù)的區(qū)間估計
4、估計量的求法
5、樣本量的確定
第四節(jié):假設(shè)檢驗 ?
1、假設(shè)檢驗、個樣本t檢驗
2、配對樣本的t檢驗、兩獨立樣本t檢驗
第五節(jié):分類數(shù)據(jù)分析
1、分類數(shù)據(jù)與卡方統(tǒng)計量
2、擬合優(yōu)度檢驗
3、列聯(lián)分析、獨立性檢驗
4、列聯(lián)分析相關(guān)測量
5、線性回歸
第六節(jié):矩陣運算
1、行列式
2、矩陣及其運算
3、矩陣的初等變換與線性方程組
4、向量組的線性相關(guān)性
5、相似矩陣
6、線性空間與線性變化
第二章:R編程基礎(chǔ)
第一節(jié):R基本知識
1、準備、數(shù)據(jù)對象
2、運算、讀寫
第二節(jié):R基本語句結(jié)構(gòu)及循環(huán)
1、語句結(jié)構(gòu)、創(chuàng)建
2、循環(huán)函數(shù)
第三節(jié):R數(shù)據(jù)清洗
1、時間、數(shù)據(jù)清洗
2、數(shù)據(jù)清洗
第四節(jié):文本對象處理
1、文本對象處理
2、正則表達式
第五節(jié):R畫圖
1、基本繪圖,圖像格式
2、ggplot2
3、目前好用的擴展
第六節(jié):R統(tǒng)計分析
1、參數(shù)估計
2、假設(shè)檢驗
第三章:R數(shù)據(jù)挖掘
第一節(jié):線性回歸,邏輯回歸,梯度下降,聚類,關(guān)聯(lián)規(guī)則,主成分因子分析
第二節(jié):關(guān)聯(lián)規(guī)則,決策樹,神經(jīng)網(wǎng)絡(luò),貝葉斯,支持向量機,隨機森林
第四章:數(shù)據(jù)挖掘案例
第一節(jié):如何在保險行業(yè)中使用決策樹并展示其成果
第二節(jié):如何在保險行業(yè)中使用決策樹并展示其成果
第三節(jié):如何利用客戶分群實現(xiàn)保險行業(yè)中潛在客戶的精準定位(K-means)
第四節(jié):基于關(guān)聯(lián)規(guī)則和協(xié)同過濾算法的商品個性化推薦